iT邦幫忙

2024 iThome 鐵人賽

DAY 6
0
生成式 AI

從零開始,打造一個生成式 AI 平台,打破程式學習的高牆系列 第 6

2024 當今 AI 生態全景圖:主流 AI 的剖析與評論

  • 分享至 

  • xImage
  •  

2024 當今 AI 生態全景圖:主流 AI 的剖析與評論

https://ithelp.ithome.com.tw/upload/images/20240906/20168979Xiv4nfeiq5.png
2024 年,AI 正處於群雄並起的戰國時代,各大科技公司紛紛推出自家的大型語言模型(LLM),不斷拓展其應用範圍。

在這篇文章中,我們將深入探討幾家主流公司(當前最知名的御三家:OpenAI、Anthropic、Google)的 AI 生態系統,並介紹他們最新推出的模型,如 GPT-4oClaude 3.5 SonnetGemini 1.5 Pro,以及一些代表性的開源模型,如 LLaMAMistral AI

每個模型在特定領域都有其獨特的優勢與不足。根據你的需求,選擇最具性價比的模型。

另外大模型的發展速度日新月異,可能我發完這篇文章的隔天,就會有一個強大且超級便宜的模型橫空出世。
所以建議隨時追蹤最新的新聞(如果不知道追蹤什麼,可以從 OpenAI、Anthropic、Google 這三大家新聞來關注)。

如何比較這些模型?

為了讓大家更容易理解,我根據個人使用經驗,對每個模型進行了評分,並分成六大類別:

  • 回應速度
  • 程式精確度
  • 中文語言表現(評估 AI 在中文修辭和用語流暢度上的表現)
  • 理解能力(這指的是 AI 在提示不詳細時的表現,理解能力越好,AI 在簡單指令下也能表現優異)
  • 成本
  • 綜合評分(性價比)

請注意,這些評分都是基於個人主觀經驗,歡迎大家分享自己的使用心得。

LLM 是如何計價的?

LLM 通常是基於 token 來計價的。你可以簡單地將 token 理解為單詞,比如 “I like cats” 這句話會被拆分成 “I”, “like”,和 “cats” 三個 token。

較長且不常見的單詞,如 "javascript",可能會占用兩個 token(“java”、“script”)。中文字則可以更簡單地理解為一個字就是一個 token。模型會根據你輸入了多少 token 以及它輸出了多少 token 來計價。

另外,假如你今天傳送了很多歷史對話給 AI,這些文字也會算入輸入 token 的範圍內。


OpenAI – GPT-4o 和 GPT-4o Mini

OpenAI 毫無疑問是目前最知名的 AI 公司,比較常被使用的模型有二

  • GPT-4o
    被人稱為現代最強的五條悟模型
    強大、快速、聰明,但也昂貴
    咱們就把他當作衡量其他模型的戰力單位吧
    評分:

    • 回應速度:8 分
    • 程式精確度:8 分
    • 中文語言表現:8 分
    • 理解能力:8 分
      成本:
    • 輸入 $2.50 / 100 萬 token
    • 輸出 $10.00 / 100 萬 token
      綜合評分:8 分
  • GPT-4o Mini
    小而強大,且成本低得驚人,適合非專業的常見應用。
    評分:

    • 回應速度:9 分
    • 程式精確度:7 分
    • 中文語言表現:7 分
    • 理解能力:6 分
      成本:
    • 輸入 $0.15 / 100 萬 token
    • 輸出 $0.60 / 100 萬 token
      綜合評分:9 分(耐不住他便宜, CP 值高)

Anthropic – Claude 3.5 Sonnet 和 Claude 3 Haiku

Anthropic 是我認為唯一能與 OpenAI 打得有來有回的公司,我非常看好它的未來發展。
當前主流的模型有三個:

  • Claude 3.5 Sonnet
    對標 GPT-4o
    但具備輸入更多 token 的能力。
    評分:

    • 回應速度:8 分
    • 程式精確度:9 分
    • 中文語言表現:8 分
    • 理解能力:8 分
      成本:
    • 輸入 $3.00 / 100 萬 token
    • 輸出 $15.00 / 100 萬 token
      綜合評分:8 分
  • Claude 3 Haiku
    速度快、聰明且價格親民,不過也算上一代的就模型了,曾經也是高 CP 值的選擇
    評分:

    • 回應速度:8 分
    • 程式精確度:6 分
    • 中文語言表現:7 分
    • 理解能力:6 分
      成本:
    • 輸入 $0.25 / 100 萬 token
    • 輸出 $1.25 / 100 萬 token
      綜合評分:7 分
  • Claude 3 Opus
    已經過時的產品,不建議使用。
    評分:

    • 回應速度:3 分
    • 程式精確度:8 分
    • 中文語言表現:8 分
    • 理解能力:8 分
      成本:
    • 輸入 $15 / 100 萬 token
    • 輸出 $75 / 100 萬 token
      綜合評分:1 分(又貴又慢)

Google – Gemini 1.5 Pro 和 Gemini 1.5 Flash

Google 的 Gemini 系列主打多模態處理,特別是在文本與圖像結合的應用上表現出色。這使得它成為處理需要多種媒體的項目的理想選擇。

  • Gemini 1.5 Pro
    個人使用感覺,在純文本生成和程式碼生成方面,表現不如 GPT-4o 或 Claude 3.5 Sonnet。
    而且 Google 對惡意字詞偵測特別奇怪,我之前只是說了臭豆腐三個字
    就被認為是惡意對話,整個 API 直接炸掉
    回答速度   8 分
    程式碼精確度 8 分
    中文造詣能力 6 分
    通靈能力   7 分
    成本

    • 輸入 $3.50 / 1百萬 token

    • 輸出 $10.50 / 1百萬 token

    綜合評分   5 分

  • Gemini 1.5 Flash
    Gemini 的輕量版,專為小規模的文本生成和視覺處理設計。
    它的處理速度快,並且成本超級低廉,甚至只有 GPT-4o-mini 的一半,非常適合輕量級應用或快速原型設計。
    回答速度   9 分
    程式碼精確度 6 分
    中文造詣能力 6 分
    通靈能力   5 分
    成本

    • 輸入 $0.075 / 1百萬 token

    • 輸出 $0.3 / 1百萬 token

    綜合評分   8 分(耐不住他真的很便宜)


開源模型 – LLaMA 和 StableLM

如果今天你要開發的應用極度看重隱私,你完全不希望讓 OpenAI、Antrophic 等其他公司去接手你的資料,那你可以試試看開源模型

你可以在你自己的電腦上運作這些模型(當然,這會對電腦顯卡的要求會很高)
對於需要高控制權的開發者來講
你可以研究看看如

  • LLaMA 3.1

  • StableLM

  • Mistral

  • Gemini Nano

當然,運行開源模型的學習成本很高,其實對於快速構建一個應用並不友善
而且如果不是隱私問題與成本問題,其實並不是特別好的選擇
所以這將不是我們本教學的重點

總結

我們大致理解了 2024 年九月的現在各種模型的差異與比較

請務必注意, AI 的發展飛速,哪怕幾個月這些排行可能都會大洗牌

隨時保持關注,特別是那御三家 AI 公司的動向

才是開發 AI 應用的上上之策

接下來我們仍會以 gpt-4o-mini 這個模型為教學範例


上一篇
第一步,打開 AI 世界的大門:OpenAI API 入門 (JavaScript)
下一篇
提示工程:如何撰寫出有效、強大的 Prompt
系列文
從零開始,打造一個生成式 AI 平台,打破程式學習的高牆17
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言